"One-Hot Encoding"은 머신러닝/딥러닝에서 "분류(Classification) 문제"를 다룰 때, "범주형 데이터(Categorical Data)를 벡터(Vector) 형태로 변환하는 기법"이다.
"One-Hot Encoding"은 "범주형 데이터를 수치형 데이터로 변환"하는 방법 중 하나이다. 변환된 벡터에서 "단 하나의 값(One)만 1(Hot)"이고, 나머지는 모두 0이므로 "One-Hot"이라는 명칭이 붙었다.
다음은 "숫자 데이터"와 "텍스트 데이터(범주형 변수)"를 원-핫 인코딩하는 예제이다.
[0, 0, 0, 1, 0, 0, 0, 0, 0, 0]
빨강 = [1, 0, 0] 파랑 = [0, 1, 0] 초록 = [0, 0, 1]